Loading [MathJax]/jax/output/CommonHTML/jax.js

যথার্থতা যাচাই (দশম অধ্যায়)

একাদশ- দ্বাদশ শ্রেণি - পরিসংখ্যান পরিসংখ্যান ২য় পত্র | - | NCTB BOOK
812
812

যথার্থতা (Accuracy):

পরিসংখ্যান অধ্যায়ে যথার্থতা একটি গুরুত্বপূর্ণ ধারণা, যা একটি পরিমাপ বা তথ্যের সঠিকতা ও নির্ভুলতাকে নির্দেশ করে। এটি আমাদের জানায় যে, একটি তথ্য বা পরিমাপ প্রকৃত অবস্থার সাথে কতটা সঙ্গতিপূর্ণ।

পরিসংখ্যানের ক্ষেত্রে যথার্থতা যাচাই করা কেন গুরুত্বপূর্ণ? কারণ আমাদের তথ্য-উপাত্তের সঠিকতা নির্ভর করে সিদ্ধান্ত গ্রহণের কার্যকারিতা ও কার্যকারণ বিশ্লেষণের ওপর। যথার্থতার অভাব ভুল সিদ্ধান্তের দিকে পরিচালিত করতে পারে এবং তা গবেষণা ও ব্যবস্থাপনায় মারাত্মক প্রভাব ফেলে।

যথার্থতার মাপকাঠি পরিসংখ্যানের বিভিন্ন ক্ষেত্রে ব্যবহার করা হয়, যেমন:

  • গবেষণা ও বিশ্লেষণ: সঠিক ডেটা থেকে কার্যকরী সিদ্ধান্ত গ্রহণ।
  • পরিমাপ ও মানদণ্ড: যন্ত্র ও পদ্ধতির নির্ভুলতা যাচাই।
  • প্রভাব বিশ্লেষণ: ডেটার উপর ভিত্তি করে নীতিমালা নির্ধারণ।

এই অধ্যায়ে আমরা যথার্থতা কী, এর প্রভাব, যাচাই পদ্ধতি, এবং পরিসংখ্যান গবেষণায় এর গুরুত্ব সম্পর্কে বিশদভাবে আলোচনা করব। এটি আপনাকে তথ্য বিশ্লেষণ ও পরিমাপের ক্ষেত্রে বাস্তব ও সঠিক সিদ্ধান্ত গ্রহণে সহায়তা করবে।

যথার্থতা যাচাই সম্পর্কিত কতিপয় সংজ্ঞা (১০.১)

476
476

যথার্থতা যাচাই সম্পর্কিত কতিপয় সংজ্ঞা:

  1. যথার্থতা (Accuracy):
    যথার্থতা হলো একটি পরিমাপ বা ডেটা প্রকৃত মানের সাথে কতটা সঠিক এবং সঙ্গতিপূর্ণ তা নির্দেশ করার মাপকাঠি। এটি ডেটার সঠিকতা এবং নির্ভুলতার মানদণ্ড।
  2. নির্ভুলতা (Precision):
    নির্ভুলতা বোঝায় যে একটি পরিমাপ বারবার করার পর প্রতিটি পরিমাপের মান কতটা নিকটবর্তী বা সঙ্গতিপূর্ণ। যদিও এটি যথার্থতার অংশ, এটি সরাসরি প্রকৃত মানের সাথে সম্পর্কিত নয়।
  3. ত্রুটি (Error):
    ত্রুটি হলো প্রকৃত মান ও পরিমাপের মানের মধ্যে পার্থক্য। এটি যথার্থতার ঘাটতির নির্দেশক।
  4. পরিমাপের পক্ষপাতিত্ব (Measurement Bias):
    এটি হলো পদ্ধতিগত ত্রুটি যা পরিমাপের যথার্থতাকে প্রভাবিত করে এবং সঠিক ফলাফল থেকে বিচ্যুতি ঘটায়।
  5. যথার্থতা যাচাই (Validation of Accuracy):
    ডেটা বা পরিমাপের যথার্থতা যাচাই করতে ব্যবহৃত পদ্ধতি বা প্রক্রিয়া। এতে বিভিন্ন পরীক্ষামূলক পদ্ধতি, পুনরাবৃত্তি এবং সংশোধনী অন্তর্ভুক্ত।
  6. প্রকৃত মান (True Value):
    প্রকৃত মান হলো একটি পরিমাপের সেই মান, যা তাত্ত্বিক বা পরীক্ষামূলকভাবে সঠিক বলে ধরা হয়।
  7. উপাদানগত ত্রুটি (Systematic Error):
    এটি হলো সেই ত্রুটি, যা একটি নির্দিষ্ট পদ্ধতি বা সরঞ্জামের কারণে সব পরিমাপে প্রভাব ফেলে।
  8. ইচ্ছাকৃত ত্রুটি (Random Error):
    এটি হলো দৈব ত্রুটি, যা পরিমাপের পরিবেশ বা মানদণ্ডের তারতম্যের কারণে ঘটে এবং এটি পূর্বানুমান করা যায় না।

এগুলো যথার্থতা যাচাইয়ের ক্ষেত্রে গুরুত্বপূর্ণ এবং পরিসংখ্যানের বিভিন্ন প্রয়োগে ব্যবহার করা হয়।

যথার্থতা যাচাই এর জন্য ব্যবহৃত বিভিন্ন স্ট্যাটিস্টিক (১০.২)

268
268

যথার্থতা যাচাই এর জন্য ব্যবহৃত বিভিন্ন স্ট্যাটিস্টিক:

যথার্থতা যাচাই পরিসংখ্যানের গুরুত্বপূর্ণ একটি দিক। এর মাধ্যমে ডেটা বা পরিমাপের সঠিকতা ও নির্ভুলতা নির্ধারণ করা হয়। নিচে যথার্থতা যাচাইয়ের জন্য ব্যবহৃত বিভিন্ন গুরুত্বপূর্ণ স্ট্যাটিস্টিক তুলে ধরা হলো:


১. গড় ত্রুটি (Mean Error):

  • সংজ্ঞা: গড় ত্রুটি হলো পরিমাপকৃত মান এবং প্রকৃত মানের মধ্যে গড় পার্থক্য।
  • সূত্র:
    Mean Error=ni=1(XiT)n
    যেখানে,
    Xi = পরিমাপকৃত মান
    T = প্রকৃত মান
    n = মোট পরিমাপের সংখ্যা

২. গড় বর্গমূল ত্রুটি (Root Mean Square Error - RMSE):

  • সংজ্ঞা: এটি একটি বহুল ব্যবহৃত পরিসংখ্যান, যা ত্রুটির স্কোয়ারের গড়ের বর্গমূল নির্দেশ করে। এটি ডেটার বিচ্যুতি পরিমাপ করে।
  • সূত্র:
    RMSE=ni=1(XiT)2n

৩. গড় আপেক্ষিক ত্রুটি (Mean Absolute Error - MAE):

  • সংজ্ঞা: পরিমাপকৃত মান এবং প্রকৃত মানের মধ্যে গড় আপেক্ষিক পার্থক্য। এটি ত্রুটির একটি সরল মাপকাঠি।
  • সূত্র:
    MAE=ni=1|XiT|n

৪. শতকরা ত্রুটি (Percentage Error):

  • সংজ্ঞা: পরিমাপকৃত মানের শতকরা বিচ্যুতি।
  • সূত্র:
    Percentage Error=|XT|T×100

৫. সহগ (Coefficient of Variation - CV):

  • সংজ্ঞা: এটি গড় মানের তুলনায় ডেটার বিচ্যুতি নির্ধারণ করে।
  • সূত্র:
    CV=σμ×100
    যেখানে,
    σ = ডেটার মানের স্ট্যান্ডার্ড ডেভিয়েশন
    μ = গড়

৬. নির্ভুলতার সহগ (Accuracy Ratio):

  • সংজ্ঞা: এটি পরিমাপের সঠিকতা বুঝাতে ব্যবহৃত হয় এবং প্রকৃত মানের সাথে ডেটার সামঞ্জস্যতা নির্দেশ করে।
  • সূত্র:
    Accuracy Ratio=Predicted ValueActual Value

৭. কপেলার সহগ (Correlation Coefficient):

  • সংজ্ঞা: এটি দুই ডেটাসেটের মধ্যে সম্পর্ক নির্ধারণ করতে ব্যবহৃত হয়। যথার্থতার জন্য উচ্চতর সহগ ভালো বলে ধরা হয়।
  • সূত্র:
    r=ni=1(XiˉX)(YiˉY)ni=1(XiˉX)2ni=1(YiˉY)2

৮. স্ট্যান্ডার্ড ডেভিয়েশন (Standard Deviation):

  • সংজ্ঞা: এটি ডেটাসেটের গড় থেকে বিচ্যুতির গড় নির্দেশ করে। কম স্ট্যান্ডার্ড ডেভিয়েশন উচ্চ যথার্থতা নির্দেশ করে।
  • সূত্র:
    σ=ni=1(XiˉX)2n

৯. R-Squared (Coefficient of Determination):

  • সংজ্ঞা: এটি একটি পরিসংখ্যান, যা পূর্বানুমান এবং প্রকৃত ডেটার মধ্যে সামঞ্জস্যতা নির্দেশ করে।
  • রেঞ্জ: ০ থেকে ১ (১ হলে এটি পূর্ণ সঙ্গতিপূর্ণ)।

উপসংহার:
উপরোক্ত পরিসংখ্যানগুলো ব্যবহার করে যথার্থতা যাচাই করা যায়। নির্ভুলতা এবং সঠিকতা নিশ্চিত করতে এই মেট্রিক্সগুলো গবেষণা ও বিশ্লেষণে গুরুত্বপূর্ণ ভূমিকা পালন করে।

গড়ের ক্ষেত্রে যথার্থতা যাচাই (১০.৩)

255
255

গড়ের ক্ষেত্রে যথার্থতা যাচাই:

গড় (Mean) পরিসংখ্যানের একটি গুরুত্বপূর্ণ মাপনী, যা ডেটার কেন্দ্রীয় প্রবণতা বোঝায়। তবে, গড়ের যথার্থতা যাচাই করতে হলে ডেটার সঠিকতা, নির্ভুলতা এবং প্রকৃত মানের সাথে সামঞ্জস্যতা যাচাই করতে হয়। নিচে গড়ের যথার্থতা যাচাইয়ের বিভিন্ন দিক তুলে ধরা হলো:


১. গড়ের ত্রুটি (Error in Mean):

গড়ের ক্ষেত্রে যথার্থতা যাচাই করতে ডেটার প্রকৃত গড়ের সাথে পরিমাপকৃত গড়ের পার্থক্য নির্ণয় করা হয়।

ত্রুটির সূত্র:
\[
\text{Mean Error} = |\bar{X}{observed} - \bar{X}{true}|
\]
যেখানে,
\(\bar{X}{observed}\) = প্রাপ্ত গড়
\(\bar{X}{true}\) = প্রকৃত গড়


২. গড় আপেক্ষিক ত্রুটি (Mean Absolute Error - MAE):

গড়ের ক্ষেত্রে সমস্ত মানের গড় আপেক্ষিক ত্রুটি পরিমাপ করে গড়ের যথার্থতা যাচাই করা হয়।

সূত্র:
MAE=ni=1|XiˉX|n
যেখানে,
Xi = ডেটার মান
ˉX = প্রাপ্ত গড়
n = ডেটার মোট সংখ্যা


৩. গড়ের গড় বর্গমূল ত্রুটি (Root Mean Square Error - RMSE):

গড়ের যথার্থতা যাচাইয়ের আরেকটি জনপ্রিয় পদ্ধতি হলো RMSE। এটি ত্রুটির স্কোয়ারের গড়ের বর্গমূল নির্দেশ করে।

সূত্র:
RMSE=ni=1(ˉXXi)2n


৪. গড়ের স্ট্যান্ডার্ড ডেভিয়েশন (Standard Deviation):

গড়ের মান থেকে প্রতিটি ডেটার বিচ্যুতি পরিমাপ করে ডেটার সঠিকতা যাচাই করা হয়। যদি স্ট্যান্ডার্ড ডেভিয়েশন কম হয়, তাহলে গড়টি বেশি সঠিক।

সূত্র:
σ=ni=1(XiˉX)2n


৫. সহগ বিচ্যুতি (Coefficient of Variation - CV):

গড়ের বিচ্যুতি যাচাই করতে CV ব্যবহার করা হয়, যা গড়ের তুলনায় ডেটার বৈচিত্র্য নির্দেশ করে।

সূত্র:
CV=σˉX×100
যেখানে,
σ = স্ট্যান্ডার্ড ডেভিয়েশন
ˉX = গড়


৬. শতকরা ত্রুটি (Percentage Error in Mean):

গড়ের ক্ষেত্রে শতকরা ত্রুটি ব্যবহার করে গড়ের যথার্থতা সহজে যাচাই করা যায়।

সূত্র:
\[
\text{Percentage Error} = \frac{|\bar{X} - \bar{X}{true}|}{\bar{X}{true}} \times 100%
\]


৭. নমুনার আকারের প্রভাব (Effect of Sample Size):

যদি নমুনার আকার বৃদ্ধি করা হয়, তবে গড়ের মান প্রকৃত মানের কাছাকাছি আসে। সুতরাং, যথার্থতা যাচাইয়ের ক্ষেত্রে বড় নমুনা ব্যবহার করাও গুরুত্বপূর্ণ।


উদাহরণ:

ধরা যাক, একটি ডেটাসেট থেকে গড় নির্ণয় করা হয়েছে ˉX=50, এবং প্রকৃত গড় ˉXtrue=48
তাহলে:

  • Mean Error: |5048|=2
  • Percentage Error: 248×100=4.17

এটি নির্দেশ করে যে গড়টি প্রকৃত মানের সাথে প্রায় ৪.১৭% বিচ্যুত।


উপসংহার:
গড়ের যথার্থতা যাচাই করতে বিভিন্ন পরিসংখ্যানিক পদ্ধতি ব্যবহৃত হয়, যা ডেটার মান ও ত্রুটির প্রকৃতি বুঝতে সাহায্য করে। যথার্থ গড় নির্ণয়ের জন্য ত্রুটি নির্ণয়, বড় নমুনা ব্যবহার, এবং ডেটার বৈচিত্র্য নিয়ন্ত্রণ করা অপরিহার্য।

অনুপাতের ক্ষেত্রে যথার্থতা যাচাই (১০.৪)

247
247

অনুপাতের ক্ষেত্রে যথার্থতা যাচাই:

পরিসংখ্যান এবং গণিতের ক্ষেত্রে অনুপাত (Ratio) হলো দুটি সংখ্যার তুলনার একটি রূপ। অনুপাতের যথার্থতা যাচাই করা গুরুত্বপূর্ণ, কারণ এটি সঠিক সিদ্ধান্ত গ্রহণ এবং বিশ্লেষণের জন্য অপরিহার্য। যথার্থতা যাচাইয়ে আমরা বিভিন্ন মাপকাঠি এবং সূত্র ব্যবহার করি যা অনুপাতের সঠিকতা নিশ্চিত করতে সহায়তা করে।


১. গড় ত্রুটি (Mean Error):

অনুপাতের ক্ষেত্রে গড় ত্রুটি নির্ণয় করা হয় প্রকৃত অনুপাত এবং প্রাপ্ত অনুপাতের পার্থক্য দিয়ে।

সূত্র:
Mean Error=ni=1|RiRtrue|n
যেখানে,
Ri = প্রাপ্ত অনুপাত
Rtrue = প্রকৃত অনুপাত
n = ডেটার সংখ্যা


২. আপেক্ষিক ত্রুটি (Relative Error):

অনুপাতের ক্ষেত্রে আপেক্ষিক ত্রুটি নির্ণয় করে দেখা হয় প্রকৃত অনুপাতের তুলনায় প্রাপ্ত অনুপাত কতটা সঠিক।

সূত্র:
Relative Error=|RiRtrue|Rtrue


৩. গড় আপেক্ষিক ত্রুটি (Mean Absolute Percentage Error - MAPE):

এটি অনুপাতের গড় আপেক্ষিক ত্রুটি নির্ধারণে ব্যবহৃত হয়।

সূত্র:
MAPE=1nni=1(|RiRtrue|Rtrue×100)


৪. গড় বর্গমূল ত্রুটি (Root Mean Square Error - RMSE):

এটি অনুপাতের যথার্থতা যাচাইয়ে ব্যবহৃত একটি জনপ্রিয় পদ্ধতি। এটি ত্রুটির গড় বর্গমূল নির্দেশ করে।

সূত্র:
RMSE=ni=1(RiRtrue)2n


৫. সহগ বিচ্যুতি (Coefficient of Variation - CV):

অনুপাতের বিচ্যুতি নির্ধারণে এটি ব্যবহৃত হয়। যদি CV কম হয়, তাহলে অনুপাতটি যথার্থ।

সূত্র:
CV=σRˉR×100
যেখানে,
σR = অনুপাতের স্ট্যান্ডার্ড ডেভিয়েশন
ˉR = প্রাপ্ত অনুপাতের গড়


৬. শতকরা ত্রুটি (Percentage Error):

অনুপাতের যথার্থতা যাচাই করতে সরাসরি শতকরা ত্রুটি ব্যবহৃত হয়।

সূত্র:
Percentage Error=|RobservedRtrue|Rtrue×100


৭. সংবেদনশীলতা বিশ্লেষণ (Sensitivity Analysis):

অনুপাতের মান পরিবর্তনের জন্য ব্যবহৃত ভেরিয়েবলগুলোর প্রভাব পরীক্ষা করা হয়। এটি অনুপাতের যথার্থতা নির্ধারণে সাহায্য করে।


৮. সঠিকতা নির্ধারণ (Validation of Accuracy):

ডেটা বা পরিমাপের অনুপাত প্রকৃত মানের সাথে কতটা সঠিক তা যাচাই করতে কপেলার সহগ (Correlation Coefficient) ব্যবহার করা যায়।

সূত্র:
\[
r = \frac{\sum_{i=1}^{n} (R_i - \bar{R})(R_{true} - \bar{R}{true})}{\sqrt{\sum{i=1}^{n} (R_i - \bar{R})^2 \cdot \sum_{i=1}^{n} (R_{true} - \bar{R}_{true})^2}}
\]


উদাহরণ:

ধরা যাক, একটি পরিমাপ থেকে প্রাপ্ত অনুপাত Ri=4:1, এবং প্রকৃত অনুপাত Rtrue=5:1
তাহলে:

  • Mean Error: |45|=1
  • Percentage Error: 15×100=20
  • RMSE: (45)21=1

উপসংহার:
অনুপাতের যথার্থতা যাচাই করার মাধ্যমে সঠিক এবং নির্ভুল তথ্য উপস্থাপন সম্ভব। উপরোক্ত পদ্ধতিগুলো ব্যবহার করে ডেটার সঠিকতা নিশ্চিত করা যায়, যা গবেষণা এবং বিশ্লেষণের মান উন্নত করে।

ভেদাঙ্কের ক্ষেত্রে যথার্থতা যাচাই (১০.৫)

370
370

ভেদাঙ্কের (Variance) ক্ষেত্রে যথার্থতা যাচাই:

ভেদাঙ্ক (Variance) একটি গুরুত্বপূর্ণ পরিসংখ্যানিক মাপকাঠি, যা ডেটার গড় মান থেকে মানগুলোর বিচ্যুতি পরিমাপ করে। ভেদাঙ্কের যথার্থতা যাচাই করা অত্যন্ত গুরুত্বপূর্ণ, কারণ এটি ডেটার ছড়িয়ে থাকার পরিমাণ বা বৈচিত্র্য নির্ধারণে ব্যবহৃত হয়। যথার্থতা যাচাইয়ের মাধ্যমে ভেদাঙ্ক সঠিকভাবে গণনা করা হয়েছে কিনা তা নিশ্চিত করা হয়।


ভেদাঙ্কের যথার্থতা যাচাইয়ের পদ্ধতি:

১. গড় ত্রুটি (Mean Error):

ভেদাঙ্কের গড় ত্রুটি নির্ণয় করে দেখা হয় প্রকৃত ভেদাঙ্ক (σ2true) এবং প্রাপ্ত ভেদাঙ্ক (σ2observed) এর মধ্যে পার্থক্য।

সূত্র:
Mean Error=|σ2observedσ2true|


২. আপেক্ষিক ত্রুটি (Relative Error):

আপেক্ষিক ত্রুটি ভেদাঙ্কের ক্ষেত্রে একটি সাধারণ যাচাই পদ্ধতি। এটি প্রকৃত ভেদাঙ্কের তুলনায় প্রাপ্ত ভেদাঙ্ক কতটা সঠিক তা বোঝায়।

সূত্র:
Relative Error=|σ2observedσ2true|σ2true


৩. গড় আপেক্ষিক ত্রুটি (Mean Absolute Percentage Error - MAPE):

ভেদাঙ্কের গড় আপেক্ষিক ত্রুটি নির্ণয় করে দেখা হয় ভেদাঙ্কের মানের শতকরা বিচ্যুতি।

সূত্র:
MAPE=1nni=1(|σ2iσ2true|σ2true×100)


৪. গড় বর্গমূল ত্রুটি (Root Mean Square Error - RMSE):

গড় বর্গমূল ত্রুটি ভেদাঙ্কের যথার্থতা যাচাইয়ের জন্য একটি বহুল ব্যবহৃত পদ্ধতি। এটি প্রাপ্ত এবং প্রকৃত ভেদাঙ্কের স্কোয়ারের গড়ের বর্গমূল নির্দেশ করে।

সূত্র:
RMSE=ni=1(σ2iσ2true)2n


৫. শতকরা ত্রুটি (Percentage Error):

ভেদাঙ্কের শতকরা ত্রুটি নির্ণয়ের মাধ্যমে প্রাপ্ত ভেদাঙ্ক এবং প্রকৃত ভেদাঙ্কের পার্থক্য শতকরা হিসাবে পরিমাপ করা হয়।

সূত্র:
Percentage Error=|σ2observedσ2true|σ2true×100


৬. স্ট্যান্ডার্ড ডেভিয়েশন এবং ভেদাঙ্কের তুলনা:

যেহেতু স্ট্যান্ডার্ড ডেভিয়েশন (σ) হলো ভেদাঙ্কের বর্গমূল, তাই স্ট্যান্ডার্ড ডেভিয়েশন এবং ভেদাঙ্কের সঙ্গতিপূর্ণতা যাচাই করাও গুরুত্বপূর্ণ। যদি স্ট্যান্ডার্ড ডেভিয়েশন এবং ভেদাঙ্কের সম্পর্ক সঠিক হয়, তবে তা যথার্থতার ইঙ্গিত দেয়।

সম্পর্ক:
σ2=Variance (ভেদাঙ্ক)


উদাহরণ:

ধরা যাক, একটি ডেটাসেট থেকে প্রাপ্ত ভেদাঙ্ক σ2observed=25, এবং প্রকৃত ভেদাঙ্ক σ2true=20
তাহলে:

  • Mean Error: |2520|=5
  • Percentage Error: 520×100=25
  • RMSE: (2520)21=5

ভেদাঙ্ক যাচাইয়ের সংবেদনশীলতা:

ভেদাঙ্ক সঠিকভাবে নির্ণয়ের জন্য বড় নমুনা আকার ব্যবহার করা জরুরি। ছোট নমুনার ক্ষেত্রে ভেদাঙ্ক যথার্থতা প্রভাবিত হতে পারে।


উপসংহার:

ভেদাঙ্কের যথার্থতা যাচাই করার জন্য বিভিন্ন পদ্ধতি ব্যবহার করা হয়, যেমন Mean Error, RMSE, এবং Percentage Error। এগুলো ব্যবহার করে ডেটার বৈচিত্র্য নির্ভুলভাবে নির্ধারণ করা যায়। যথার্থ ভেদাঙ্ক নির্ণয় গবেষণা এবং বিশ্লেষণের মান উন্নত করে।

টপ রেটেড অ্যাপ

স্যাট অ্যাকাডেমী অ্যাপ

আমাদের অল-ইন-ওয়ান মোবাইল অ্যাপের মাধ্যমে সীমাহীন শেখার সুযোগ উপভোগ করুন।

ভিডিও
লাইভ ক্লাস
এক্সাম
ডাউনলোড করুন
Promotion